Méthodologie 3-way d'extraction d'un modèle articulatoire de la parole à partir des données d'un locuteur
نویسندگان
چکیده
Résumé. Pour parler, le locuteur met en mouvement un ensemble complexe d’articulateurs : la mâchoire qu’il ouvre plus ou moins, la langue à laquelle il fait prendre de nombreuses formes et positions, les lèvres qui lui permettent de laisser l’air s’échapper plus ou moins brutalement, etc. Le modèle articulatoire le plus connu est celui de Maeda (1990), obtenu à partir d’Analyses en Composantes Principales faites sur les tableaux de coordonnées des points des articulateurs d’un locuteur en train de parler. Nous proposons ici une analyse 3-way du même type de données, après leur transformation en tableaux de distances. Nous validons notre modèle par la prédiction des sons prononcés, qui s’avère presque aussi bonne que celle du modèle acoustique, et même meilleure quand on prend en compte la co-articulation.
منابع مشابه
Vers une inversion acoustico-articulatoire d'un locuteur étranger (Toward an acoustic to articulatory inversion of a foreign speaker) [in French]
L’inversion acoustico-articulatoire consiste à déterminer la forme du conduit bucal à partir d’un enregistrement audio de parole. Il s’agit plus précisément de reconstruire la trajectoire de divers points situés sur la langue, les lèvres et la machoire (et éventuellement le palais) à partir du signal acoustique. Intéressante en tant que telle pour l’étude des processus de production de la parol...
متن کاملModélisation et extraction de données pour un entrepôt objet
Résumé : Cet article traite de la modélisation orientée objet pour la conception d'un entrepôt de données complexes et historisées (conservation des évolutions). Un des aspects majeurs de cette modélisation est l'extension du concept de classe par celui de classe entrepôt, défini au travers d'un filtre temporel et d'un filtre d'archives ainsi que d'une fonction de construction. Les filtres gère...
متن کاملHMMs and GMMs based methods for acoustic - to - articulatory speech inversion
Afin de récupérer les mouvements des articulateurs tels que les lèvres, la mâchoire ou la langue, à partir du son de parole, nous avons développé et comparé deux méthodes d’inversion basées l’une sur les modèles de Markov cachés (HMMs) et l’autre sur les modèles de mélanges de gaussiennes (GMMs). Les mouvements des articulateurs sont caractérisés par les coordonnées médiosagittales de bobines d...
متن کاملBase de données à base ontologique: le modèle OntoDB
Nous proposons dans cet article un nouveau modèle de base de données appelé base de données à base ontologique (BDBO) qui présente deux caractéristiques. D'une part, il permet de gérer à la fois des ontologies et des données. D'autres part, il permet d'associer à chaque donnée le concept ontologique qui en définit le sens. Les ontologies considérées sont celles qui peuvent s'exprimer sous forme...
متن کاملEigenvoices: A compact representation of speakers in model space
Titre francais: Voix propres: Vers une représentation compacte des locuteurs dans l'espace des modèles Traduction du titre des figures: Figure 1: Schéma bloc d'un système de reconnaissance de la parole Figure 2: Schéma général du système de voix propres 1 Summary: In this article, we present a new approach to modeling speaker-dependent systems. The approach was inspired by the eigenfaces techni...
متن کامل